2023人工智能大事件回顾丨中国AI大模型篇
中国大模型篇
-2023 Annual Major Events-
全国首个人工智能公共算力平台在上海正式投用
2月20日,全国首个人工智能(AI)公共算力平台在上海正式投用,该平台依托上海超级计算中心建设及运用,将用于满足科研机构和广大中小微企业实际算力需求,探索算力调度新模式。
国内第一个对话式大型语言模型MOSS发布
2月,国内第一个对话式大型语言模型MOSS由邱锡鹏教授团队发布至公开平台邀公众参与内测,为国内首个发布的类ChatGPT模型。复旦大学计算机科学技术学院教授、MOSS 系统负责人邱锡鹏表示:“这是国内第一个插件版对话语言模型 ,能使用搜索引擎、图像生成模型、方程求解器等外部工具,为用户提供越来越多的服务。GPT-4 也能接入各种插件,这种能力在大模型落地应用过程中会很有价值。〞整体而言,MOSS 基于公开的中英文数据训练,目前已经拥有200亿参数,具有和人类对话的能力,并可以通过与人类交互实现迭代优化。
百度大语言模型产品“文心一言”正式发布
3月16日,百度大语言模型产品“文心一言”正式发布,这是继OpenAI发布ChatGPT后,中国第一款生成式语言大模型产品,具备五大能力:文学创作、商业文案创作、数理逻辑 推算、中文理解、多模态生成。7个月后,文心大模型4.0问世,同步开始邀测,并带来全线重构的新搜索等十余款AI原生应用。
大模型创企百川智能成立
4月10日,前搜狗CEO王小川、前搜狗COO茹立云联手成立国内大模型创企百川智能。1个月后,百川智能拿到了来自腾讯、小米、金山、清华大学资产管理有限公司等十余家机构的联合投资,整体估值超10亿美元。半年内,百川智能已经发布超7款大模型,参数规模从10亿到超百亿不等,覆盖开源、闭源。
知乎推出首个中文大模型“知海图 AI〞
4月,知乎推出首个中文大模型“知海图 AI〞,该大模型在成熟大模型CPM-Bee 基础上研发,拥有千亿级参数,具备更强的逻辑推理能力,更快的训练和推理速度。“知海图 A〞 在公司业务提效上收益显著,其在分层、分类、兴趣理解、搜索等业务场景广泛应用大模型能力,人工标注量降低了 90%以上,业务准召效果普遍提升了15%以上。
科大讯飞正式发布“讯飞星火认知大模型”
5月6日,科大讯飞正式发布“讯飞星火认知大模型”,在文本生成、知识问答、数学能力三大能力上超过 ChatGPT。6月,讯飞星火认知大模型通过中国信通院组织的国内首个官方可信AIGC大模型基础能力(功能)评测,并且获得认证通过全部功能项。10月,讯飞星火认知大模型V3.0版本发布,七大能力持续提升,整体超越ChatGPT,医疗六大核心能力超越GPT-4。
华为正式发布人工智能大模型华为云盘古大模型3.0
7月7日,华为正式发布人工智能大模型华为云盘古大模型3.0——面向行业的大模型系列包括“5+N+X”三层架构,包括底层(L0)的通用大模型、第二层(L1)的行业大模型和第三层(L2)的细分场景模型。在金融、金融制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值。
京东发布言犀大模型
7月13日,在2023京东全球科技探索者大会暨京东云峰会上,京东言犀大模型正式推出。与通用大模型不同,京东言犀大模型是立足于产业研发的。它融合了 70%通用数据与 30%数智供应链原生数据,具有“更高产业属性、更强泛化能力、更多安全保障”的优势,致力于各种产业场景,解决真实的产业问题。言犀大模型已经在消费导购、商家经营、客服售后、医疗问诊等多个供应链场景中试点接入。此外,在内部经营管理方面,京东尝试将大模型应用于系统代码辅助编写,实现了20%以上的效率提升;也开始测试 AIGC 自动生成商品营销图文的能力,目前已推广至 2000 多个零售三级品类。
网易有道发布国内首个教育领域垂直大模型“子曰”
7月26日,网易有道发布国内首个教育领域垂直大模型“子曰”,同时陆续推出搭载“子曰”教育大模型的六大应用成果——虚拟人口语教练Hi Echo、LLM翻译、AI作文指导、语法精讲、AIBox、文档问答。该模型拥有更专业的预训练语料,可以依据用户的不同学习场景下需求,向其提供对话。
中国首颗AI卫星成功发射
8月10日,中国首颗以人工智能(AI)载荷为核心、具备智能操作系统的智能应急卫星“地卫智能应急一号”(又名WonderJourney-1A,简称WJ-1A),在酒泉发射中心成功发射并进入预定轨道。
抖音宣布开始对外测试 AI 对话产品 “豆包”
8月17日,抖音集团(前字节跳动)宣布开始对外测试 AI 对话产品 “豆包”。据称,“豆包〞是字节跳动公司基于云雀模型开发的 AI 工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页 web 平台,i0s 以及安卓平台,但 ios 需要使用TestFlight 安装。
腾讯混元大语言模型正式亮相
2023年9月7日,腾讯混元大语言模型在2023腾讯全球数字生态大会上正式亮相,并宣布通过腾讯云对外开放。这是腾讯首次披露的通用大语言模型。混元大模型拥有超干亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力 ,以及可靠的任务执行能力。在多个场景下,腾讯混元大模型已经能够处理超长文本,通过位置编码优化技术,混元大模型对于长文处理效果和性能得到了提升。并且混元大模型还具有识别“陷阱”的能力,简单来说就是通过强化学习方法拒绝被 “诱导〞。
阿里云“通义千问”大模型向公众开放
9月13日,阿里云宣布其最新的人工智能大模型“通义千问”已经通过备案,并表示将开源一个更大参数规模的大模型版本,供全社会免费商用。该举措旨在降低大模型使用门槛,推动人工智能技术发展与普及。
金山办公宣布WPS AI已接入金山办公全线产品
9月,金山办公官方宣布,基于大语言模型的智能办公助手WPS AI已接入金山办公全线产品,邀请用户体验全组件 AI 功能。金山办公将应用大模型重构办公软件 ,为每一位用户提供 AIGC(内容创作)、Copilot( 智慧助理)和Insight(知识洞察)三方面全新的产品体验。WPS AI 作为协同办公赛道的类ChatGPT式应用 ,己接入 WPS 文字、演示、表格、PDF、金山文档等产品线,解决用户在内容生成、内容理解、指令操作等方面的日常办公难题。公司率先实现大语言模型在各端落地,构建稳定的 Office基建服务,并为 AI 功能提供简洁的交互框架、接入指南和准入标准,确保产品的智能化体验。
中国原生大模型ChatGLM3发布
10月27日,智谱AI于2023中国计算机大会(CNCC)上,推出了全自研的第三代基座大模型ChatGLM3 及相关系列产品。在全新升级的ChatGLM3 赋能下,生成式 AI 助手智谱清言已成为国内首个具备代码交互能力的大模型产品(Code Interpreter),可支持图像处理、数学计算、数据分析等使用场景。
百川智能宣布推出 Baichuan2-192K 大模型
10月30日,百川智能宣布推出 Baichuan2-192K 大模型,其上下文窗口长度高达 192K,能够多处理约 35 万个汉字。据悉,Baichuan2-192K 将以API调用和私有化部署的方式提供给企业用户。目前百川智能已经启动该大模型的API 内测,并开放给法律、媒体、金融等行业的核心合作伙伴。
主理人丨刘典
文案丨陶含孜
排版丨赵杨博
校审丨王祚
终审丨梁正 鲁俊群
关于我们
清华大学人工智能国际治理研究院(Institute for AI International Governance, Tsinghua University,THU I-AIIG)是2020年4月由清华大学成立的校级科研机构。依托清华大学在人工智能与国际治理方面的已有积累和跨学科优势,研究院面向人工智能国际治理重大理论问题及政策需求开展研究,致力于提升清华在该领域的全球学术影响力和政策引领作用,为中国积极参与人工智能国际治理提供智力支撑。
新浪微博:@清华大学人工智能国际治理研究院
微信视频号:THU-AIIG
Bilibili:清华大学AIIG